查看原文
其他

人着床后体内胚原肠化的scRNA分析

登峰 单细胞天地 2022-08-10

分享是一种态度

文章信息

文章题目Single-cell transcriptomic characterization of a gastrulating human embryo日期:nature
期刊:2021年11月
DOI:https://doi.org/10.1038/s41586-021-04158-y
Data

  • human:http://www.ebi.ac.uk/microarray-as/aer/result?queryFor=Experiment&eAccession=E-MTAB-9388

引用

  • mouse:http://www.ebi.ac.uk/microarray-as/aer/result?queryFor=Experiment&eAccession=E-MTAB-6967
  • human:http://www.ebi.ac.uk/microarray-as/aer/result?queryFor=Experiment&eAccession=E-MTAB-3929

可视化:http://www.human-gastrula.net/
可视化shiny源码:https://github.com/ScialdoneLab/human-gastrula-shiny

尽管一个胚胎,但我认为应该是相当有用的一篇文章,可以部分解决体外胚中部分不保守的现象。感谢捐赠者。

分析流程

pipeline

背景

老话怎么说来着,人一生最重要的时刻不是你出生、结婚抑或死亡,而是原肠化...

原肠形成时所有多细胞生物发育的一个基本过程。藉由该过程,动物基本的身体结构开始发生,是协调细胞多样性的关键进程。在人类中,原肠胚形成发生在受精后的第三周,对于该阶段的理解相对有限。本文研究了人体内整个原肠胚的单细胞转录组图谱(E16-19),分析细胞类型并于体外模型进行比较。除了分析多能性细胞外,作者鉴定了PGC、红细胞和各种中内胚层细胞。总之一句话,这个数据杠杠有用。

摘要

人原肠化发生于第三周,持续一周多一点。因此,目关于人原肠化的认知,几乎完全基于从模型系统、历史样品和最近发表的体外培养模型外的推断,包括微孔培养ES、hES接种鸡胚和hES 的3D模型系统。作者收到了卡内基分期(CS)7的胚胎,相当于E16-19,做了以下分析。

结论

CS7 人原肠胚特征

卡内基分期如下:

【镜·界】胚胎镜检查的卡内基分期

该胚胎核型正常,男孩子,对应PCW2-3,样品完全完整且形态正常,包括带有羊膜腔的胎盘,体蒂和带有色素细胞的卵黄囊。解剖卵黄囊和体蒂,分离上覆羊膜的胚盘。胚胎背腹侧照片显示,PS延长大约到胚盘一半的位置,原结在PS 的发端可见。为了在测序时保存解剖信息,将胚胎细分为卵黄囊、头端胚和尾端胚。

经质控,剩余1195个细胞(665个尾端,340个头端,190个卵黄囊),所有细胞均有chr Y 基因表达,且XIST 几乎检测不到,证实没有母源细胞污染。所有细胞周期可见,indel 与其他数据集范围相近,表明基因组正常。

采用无监督聚类浆细胞分为11个亚群,结合解剖信息,将之分别鉴定,见上图。结合鼠猴数据,证实了该分类的准确性:

fig S2

细胞类型多样化

CS7 的epiblast cluster 给定义人primed state 的提供了新角度。为了确定体内primed和naive细胞的真实坐标,整合分析了一组公共数据,该数据包含了从morula-E7的scRNA data。细胞基本可以根据发育阶段分开,并将体外培养的naive和primed 的hESC映射到该数据集。作者发现naive ESC接近E6-7,而primed接近CS7 的epiblast,这证明了体外primed 基本可以代表体内primed state。当然,体内外的naive和primed仍显示出了一些差异,这表明体外体系需要进一步完善。同样用这种这方法,评估了体外原肠胚模型:

Fig2A.harmony整合
Fig_S3A-C

RNA速率分析显示,由epiblast发端,中内胚层一骑绝尘分成两支。DC1与细胞类型和空间位置相关,基于他们离epi的远近,反应了细胞的分化程度或“年龄”。例如,在原肠形成早期出现的胚外中胚层(extra-embryonic mesoderm)细胞比出现较晚的轴中胚层(axial mesoderm)细胞离epi更远(说实在的,这个图的点太大了,很多细胞都看不清)。将中胚层注释为早中晚(nascent, emergent and advanced mesoderm)三个阶段,其表达的markers有重叠(旁轴中胚层和侧中胚层)。这表明在该阶段,这些细胞并没有产生特定的中胚层亚型,而是处于过渡态:

fig2B
fig_S3D
FIG 4-1
FIG4-2

为了探索epiblast在原肠化过程中的变化,作者用epiblast、PS、初生中胚层和ectoderm 建了RNA速率模型。这一结果说明,由epiblast起,发生两个分支,一侧由PS发育到中胚层,一侧发育到ectoderm(为什么做这个呢,我认为是上面的图看不清楚epiblast的具体变化,ectoderm 并没有和epiblast分开,只有中内胚层两个大支,对应附图也是如此)。采用基于扩散映射的拟时分析,提供了一种方法来推断epiblast分化为ectoderm或进入PS并开始分化为 nascent mesoderm时的基因表达变化。我们可以检测到ectoderm markers(DLX5, TFAP2A and GATA3)确切上调,而早期神经诱导markers(SOX1, SOX3 and PAX6)和分化的神经元markers(TUBB3, OLIG2 and NEUROD1)无法检测到或表达极低;尤其是没有任何细胞表达 SOX3, PAX6, TUBB3三者中的任两者。这表明CS7中神经分化尚未开始:

fig 2C
fig S5

小鼠是研究哺乳动物原肠化的主要模型。为了无偏测试人鼠原肠化之异同,作者采用拟时分析来比较二者epiblast到nascent mesoderm 之间的等价细胞群。鉴定出二者共有662个基因延发育轨迹差异表达,大多数(531)在拟时轨迹中具有相同趋势(皆增-117;皆减-414)。举个栗子,二者从epiblast到nascent mesoderm转变过程中,CDH1表达降低,TBXT瞬时表达,SNAI1持续上升。当然也有二者不同趋势的基因,如SNAI2仅在人中上调,TDFG1二者相反,FGF8仅在鼠中瞬时表达,FGF2人下调鼠不表达:

fig S6
fig 2D

为了验证这种人特异转录趋势,作者将hES分别诱导为经EMT的ME(正常发育走向)和用PD抑制MEK通路的非EMT的ME(非正常走向),证实了上图d的结果:

fig 2E-F
fig S7

将这一比较延伸到食蟹猴中(王红梅组dpf16 体外培养胚胎,看了三个通路配体受体表达):

fig S8

Cluster 细胞亚型

Ectoderm (amniotic/embryonic) cluster在神经板吻侧表达 embryonic ectoderm markers,这些细胞将产生surface ectoderm 和amniotic ectoderm。对这部分细胞再分析发现分为俩群,一个代表amniotic ectoderm,高表达VTCN1和GABRP;另一个要么是神经板吻侧的embryonic  non-neural ectoderm,要么是未成熟羊膜:

fig 3A

PGC是起源于早期epiblast的关键细胞群。在小鼠中,PGC约在E7.25出现。最近的工作表明,非人灵长类动物和体外人胚的E11可鉴定出PGC markers,作者在PS cluster中可以检测到少量PGC。本文数据与人猴比较确定了PGC一些相同或不同的markers:

fig 3B

根据基因表达和解剖注释发现,endoderm cluster具备高度有序的亚结构。亚群分析显示有四个cluster:hypoblast、yolk sac和两个终末内胚层;与小鼠E7.25 endoderm 共比较证实了该注释的可靠性,两个终末内胚层占据了尾端胚胎大部分细胞,它俩主要区别就是细胞周期的差别。与DE2相比,DE1的增殖能力更强;DE2中anterior endoderm markers 如 HHEX, OTX2, SHISA2 和CER1表达增加。转录本亚型分析还揭示了这些内胚层cluster在诸如APOA2 和TTR等markers上差异表达。

fig 3C
fig S9

造血祖细胞的成熟

初步分析发现了两个血液相关的cluster,即幼红细胞(erythroblasts)和血内皮祖细胞(haemato-endothelial progenitors,HEP)。幼红细胞与yolk sac中的色素细胞及胚胎球蛋白基因表达一致,但在小鼠中没有同期的色素血细胞。XIST和Y染色体特异性基因的表达排除了这些细胞的母源来源可能性:

fig 4A
fig S10-A

HEP的无监督聚类包含四个亚群:endothelium(内皮细胞)、megakaryocyte-erythroid progenitors(巨核细胞-红细胞祖细胞,同时表达巨核细胞和红细胞markers)、myeloid progenitors(髓系祖细胞)和 erythro-myeloid progenitor(红系骨髓祖细胞,EMP)。扩散映射分析显示了HEP的亚型分离:

fig 4B
fig 4C
fig S10-B
fig S10-CD
FIG S10-EF

含血红蛋白细胞和多个造血祖细胞群的存在表明,与同期的小鼠胚胎(E6.75-E7.5)相比,人造血相关发育的更远。为证实这一点,作者联合E6.5-E8.5的小鼠胚胎数据分析发现,与人epiblast和PS同期的E7.0-E7.5相比,人造血细胞群更接近E8.5细胞。这证实了作者的推断:

fig 4D
fig S10-G
fig S10-H

讨论

  1. 作者保证这枚胚胎发育正常;

  2. CS7已出现PGCs和红细胞,但尚未启动神经分化;

  3. 人鼠epiblast-mesoderm 的信号通路大致相同;

  4. EMT人鼠间可能不保守;

  5. 应该将人的这批数据和兔子、鸡或者其他非人灵长类比较,这样可以明确人鼠差异在多大程度上是仅进化不同,或是形态学差异所致。

方法

Raw data处理

Salmon 定量,参考基因组GRCh38.p13,比对模式quasi-mapping-based,生成gene-count矩阵,保留基因数> 2000、比对率>55%、线粒体比例<2%、ERCC比例<20%。scran包用于normalize,再进行ln(x+1)转化。

Cluster和细胞鉴定

图聚类,调用scanpy,鉴定top4000高变基因,细胞间距离用根号下(1 − ρ)/2计算,ρ是spearman相关。随后用scanpy 的neighbors,调方法为UMAP计算邻域,最后用Leiden 算法cluster。

Cluster间的差异基因用Wilcoxon 秩和检验分析,用Benjamini-Hochberg 矫正,再将FDR排序。然后scale数据,范围为0-1画热图。

Isoform分析

Salmon包含该数据。将之转为cpm,筛掉比对大于80% single isoform,卡方检验分析isoform差异。

拟时分析和速率分析

diffmap建轨迹,坐标用于RNA速率。用STAR比对,将bam文件扔到velocy 中,用默认的run-smartseq2模式处理,随后筛掉<10 splice 的基因,用 scVelo计算速率矩阵。

拟时分析则将DC1最高的细胞定义为根,用R包 gam 拟合基因表达水平,将拟时值转为1-dpt方便画图。

人鼠EMT比较

方法和上面差不多,先进行物种内分析,再取同源基因,将矩阵分别按照各自的最大表达值进行归一化。

小鼠cluster和血液分期分析

将基因表达中位值作为小鼠每群的pattern, R包scmap 的scmapCluster计算人与之最相近的cluster。

关于scmap,见周运来博文:

https://www.jianshu.com/p/cd710fa2791a

跨物种信号比较

从MSigDB 上下载FGF、WNT 和 BMP 三个通路基因,用秩和检验的w计算z-score,代码如下:

Z=(abs(W-n*(n+1)/4)-0.5)/sqrt(n*(n+1)*(2*n+1)/24)

细胞周期

用这篇文章 Computational assignment of cell-cycle stage from single-cell transcriptome data 里的方法计算细胞周期,python链接如下:

https://pypairs.readthedocs.io/en/latest/documentation.html

人和非人灵长类动物比较

王红梅组数据,用Seurat整合,计算每个cluster的平均表达水平,再做层次聚类。

PGC鉴定和跨物种比较

调用RaceID 对PS进行分析。小鼠取了E7.5的epi、PS和PGC,猴取了L-epi、L-gast1和PGC。计算PGC zscore画图。

Indel 分析

比较了人胎肝数据集。有类似的文章解读如下:

https://www.jianshu.com/p/7b67830692db

本文参考为 https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6659636/

将数据trim到一样长,用bwa比对分析,参考数据集为这篇文章:Indel detection from DNA and RNA sequencing data with transIndel

头尾端中胚层差异基因分析

DESeq2 ,Seurat。先创建seurat对象,然后将之转为DESeq2对象,FDR<0.1,同时控制了板子间的差异。

hESC比较

E3-7的胚胎,选择log10(x) > 5.5的细胞分析。这篇文章我写过解读,链接如下:

https://mp.weixin.qq.com/s/XumW4_kl3ck7dRFv52L9yw

CPM标准化,用harmony和seurat整合。E6中提取细胞将之定义为naive,计算CS7和E6的HVG分析。

人体外原肠胚比较

用了这篇文章:An in vitro model of early anteroposterior organization during human development 的数据。空转数据。处理方法和上面提到的相差不大。空转数据我不太熟悉,就不列方法了。

总结:

很好的分析方法,很好的数据,都值得参考。



往期回顾

【文献】多发性骨髓瘤细胞骨髓微环境单细胞图谱

一个很有想法的工具——Ikarus,想要在单细胞水平直接鉴定肿瘤细胞

两次单细胞差异分析后的结果进行相关性散点图绘制






如果你对单细胞转录组研究感兴趣,但又不知道如何入门,也许你可以关注一下下面的课程



看完记得顺手点个“在看”哦!


生物 | 单细胞 | 转录组丨资料每天都精彩

长按扫码可关注

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存